IT之家 04-21 07:10

阿里通义 Fun-ASR1.5 语音识别大模型发布:精通 30 国语言及中文七大方言

📌 一句话:阿里发布听懂30国语言和7大方言的语音AI,宣告语音交互正式进入"全球通"时代。

💡 3个要点

  • 支持英语、日语、韩语等30种语言,涵盖全球主要语言体系

  • 中文识别覆盖粤语、四川话、闽南语等七大方言,解决"听不懂土话"痛点

  • 作为通义大模型家族新成员,标志着阿里在多语言AI赛道加速布局

📖 背景

语音识别技术近年从"普通话+英语"向全场景渗透。智能音箱、手机语音助手已走进千家万户,但方言和外语识别仍是短板。

💭 点评

Fun-ASR1.5的意义不只是技术秀肌肉。方言识别意味着AI开始"入乡随俗",对多语言家庭和方言文化保护意义深远;30种外语支持则让跨国商务沟通、多语言内容创作门槛大幅降低。但技术越强大,数据安全这根弦越要绷紧——我们的声音数据流向何处、如何保护,值得持续关注。 ---

📡 来源:IT之家

码头码农 - 微信搜索关注